☰
11.4.2 Dyna 스타일 알고리즘: 가상 데이터(Rollout)를 통한 모델 프리 에이전트 학습 (MBPO)
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 11. 세계 모델과 모델 기반 강화학습 (World Models & Model-Based RL)
/
11.4 계획(Planning)과 정책 최적화(Policy Optimization)
/
11.4.2 Dyna 스타일 알고리즘: 가상 데이터(Rollout)를 통한 모델 프리 에이전트 학습 (MBPO)
11.4.2 Dyna 스타일 알고리즘: 가상 데이터(Rollout)를 통한 모델 프리 에이전트 학습 (MBPO)